<h2 class="heading" data-id="heading-0">作者介绍</h2>
<p>周兴博，互联网行业十年从业者，出于对全栈工程师头衔的渴望，从事过多种技术岗位，信息安全、基础网络服务、服务端架构、机器学习、NLP等，积累了丰富的经验，对各种技术有着深刻理解，熟练使用Python，Golang，Java等开发语言，在亿级日活的互联网公司设计并开发过搜索系统、推荐系统。</p>
<h2 class="heading" data-id="heading-1">小册介绍</h2>
<p>随着人工智能技术的发展，越来越多的互联网公司开始重视机器学习在其业务中的价值。就拿近些年大火的字节跳动来说，其旗下的今日头条、抖音、西瓜视频，都是依靠着其强大的智能推荐系统，将海量的内容以个性化的方式分发给用户，最终赢得了大量的忠实用户，这背后自然是离不开NLP的功劳。</p>
<p>NLP是Natural Language Processing的缩写，中文意思是自然语言处理，是人工智能的一个子领域。由于深度学习的发展，机器在图像识别、语音识别方面已经取得了巨大的进步，达到了惊人的准确率。而让机器能够理解人类语言的这个问题上，还有很大的发展空间，所以掌握NLP的基础知识就非常有必要。</p>
<p></p><figure><img class="lazyload inited" data-src="https://user-gold-cdn.xitu.io/2019/10/31/16e215f52b00ad9b?imageView2/0/w/1280/h/960/format/webp/ignore-error/1" data-width="836" data-height="574" src="data:image/svg+xml;utf8,&lt;?xml version=&quot;1.0&quot;?&gt;&lt;svg xmlns=&quot;http://www.w3.org/2000/svg&quot; version=&quot;1.1&quot; width=&quot;836&quot; height=&quot;574&quot;&gt;&lt;/svg&gt;"><figcaption></figcaption></figure><p></p>
<p>在中文的语言环境里，中文分词是NLP最基础，也是最核心的问题，几乎影响着所有NLP任务最后结果的质量。想必做过全文搜索、关键词挖掘的同学，都切身的感受过中文分词那满满的恶意，大量的专有名词切分不出来，或者切分出来很多的歧义词。这时候只能是无奈的手动一个一个往分词词典里添加或者调整词频，但这样不仅耗时耗力，而且治标不治本，无法跟上业务的发展速度。</p>
<p>本小册的核心是希望通过深入讲解中文分词的原理及实践经验，来帮助大家彻底掌握中文分词技术，以便能够灵活应对各种分词难题。同时中文分词背后所涉及到的算法和模型，都是机器学习最重要的基础，有助于大家从事其它机器学习的相关工作。</p>
<h2 class="heading" data-id="heading-2">你会学到什么？</h2>
<p>中文分词经历了20多年的发展，从最开始的蛮荒阶段，到现在的趋于成熟，过程中克服了种种艰难险阻，产生了大量思想和方法，我会取其精华，并深入浅出地讲述给大家，大家会学到：</p>
<ol>
<li>少量的中文语言学，帮助理解中文分词所要面对的难题</li>
<li>Python的编程知识，用于算法的实践和开源项目的源码讲解</li>
<li>统计学和信息论，中文分词的算法里使用了很多这两方面的知识</li>
<li>机器学习知识，主要涉及HMM、CRF、Word2vec等模型</li>
<li>业务案例分析，结合实际业务场景，介绍各种解决方案</li>
</ol>
<h2 class="heading" data-id="heading-3">适宜人群</h2>
<ol>
<li>渴望从事NLP相关工作的初学者</li>
<li>希望提高NLP基础理论知识和实践技巧的初中级开发者</li>
<li>对机器学习、NLP等技术感兴趣的爱好者</li>
</ol>
<h2 class="heading" data-id="heading-4">购买须知</h2>
<ol>
<li>本小册为图文形式内容服务，共计 20 节；</li>
<li>全部文章预计 11 月 10 日更新完成；</li>
<li>购买用户可享有小册永久的阅读权限；</li>
<li>购买用户可进入小册微信群，与作者互动；</li>
<li>掘金小册为虚拟内容服务，一经购买成功概不退款；</li>
<li>掘金小册版权归北京北比信息技术有限公司所有，任何机构、媒体、网站或个人未经本网协议授权不得转载、链接、转贴或以其他方式复制发布/发表，违者将依法追究责任；</li>
<li>在掘金小册阅读过程中，如有任何问题，请邮件联系 xiaoce@xitu.io</li>
</ol>
